智能论文笔记

VREN: Volleyball Rally Dataset with Expression Notation Language

Haotian Xia , Rhys Tracy , Yun Zhao , Erwan Fraisse , Yuan-Fang Wang , Linda Petzold

分类：机器学习

2022-09-28

这项研究旨在实现两个目标：第一个目标是策划一个大型且信息丰富的数据集，其中包含有关球员的行动和位置的关键和简洁的摘要，以及在专业和NCAA中排球的来回旅行模式Div-i室内排球游戏。尽管几项先前的研究旨在为其他运动创建类似的数据集（例如羽毛球和足球），但尚未实现为室内排球创建这样的数据集。第二个目标是引入排球描述性语言，以充分描述游戏中的集会过程并将语言应用于我们的数据集。基于精选的数据集和我们的描述性运动语言，我们使用我们的数据集介绍了三项用于自动化排球行动和战术分析的任务：（1）排球拉力赛预测，旨在预测集会的结果，并帮助球员和教练改善决策制定决策在实践中，（2）设置类型和命中类型预测，以帮助教练和球员更有效地为游戏做准备，以及（3）排球策略和进攻区统计，以提供高级排球统计数据，并帮助教练了解游戏和对手的策略更好的。我们进行了案例研究，以展示实验结果如何为排球分析社区提供见解。此外，基于现实世界数据的实验评估为我们的数据集和语言的未来研究和应用建立了基准。这项研究弥合了室内排球场与计算机科学之间的差距。

translated by 谷歌翻译

Flow Lenia: Mass conservation for the study of virtual creatures in continuous cellular automata

Erwan Plantec , Gautier Hamon , Mayalen Etcheverry , Pierre-Yves Oudeyer , Clément Moulin-Frier , Bert Wang-Chak Chan

分类：神经与进化计算 | 人工智能

2022-12-14

Lenia is a family of cellular automata (CA) generalizing Conway's Game of Life to continuous space, time and states. Lenia has attracted a lot of attention because of the wide diversity of self-organizing patterns it can generate. Among those, some spatially localized patterns (SLPs) resemble life-like artificial creatures. However, those creatures are found in only a small subspace of the Lenia parameter space and are not trivial to discover, necessitating advanced search algorithms. We hypothesize that adding a mass conservation constraint could facilitate the emergence of SLPs. We propose here an extension of the Lenia model, called Flow Lenia, which enables mass conservation. We show a few observations demonstrating its effectiveness in generating SLPs with complex behaviors. Furthermore, we show how Flow Lenia enables the integration of the parameters of the CA update rules within the CA dynamics, making them dynamic and localized. This allows for multi-species simulations, with locally coherent update rules that define properties of the emerging creatures, and that can be mixed with neighbouring rules. We argue that this paves the way for the intrinsic evolution of self-organized artificial life forms within continuous CAs.

translated by 谷歌翻译

AutoML-based Almond Yield Prediction and Projection in California

Shiheng Duan , Shuaiqi Wu , Erwan Monier , Paul Ullrich

分类：机器学习

2022-11-08

Almonds are one of the most lucrative products of California, but are also among the most sensitive to climate change. In order to better understand the relationship between climatic factors and almond yield, an automated machine learning framework is used to build a collection of machine learning models. The prediction skill is assessed using historical records. Future projections are derived using 17 downscaled climate outputs. The ensemble mean projection displays almond yield changes under two different climate scenarios, along with two technology development scenarios, where the role of technology development is highlighted. The mean projections and distributions provide insightful results to stakeholders and can be utilized by policymakers for climate adaptation.

translated by 谷歌翻译

FBI: Fingerprinting models with Benign Inputs

Thibault Maho , Teddy Furon , Erwan Le Merrer

分类：机器学习

2022-08-05

深神经网络的指纹识别的最新进展检测了放置在黑盒相互作用方案中的模型实例。指纹协议使用的输入专门为要检查的每个精确模型而设计。尽管在这种情况下有效，但这仍然导致仅在模型的修改（例如重新训练，量化）之后缺乏保证。本文通过推广到模型家族及其变体的概念来应对提出的i）指纹识别方案，这些方案有抵御模型的重大修改，ii）ii）延伸指纹任务，包括指纹任务，包括一个人，不仅需要指纹指纹指纹指纹指纹。一个精确的模型（以前称为检测任务），但还可以确定哪个模型族在Black-Box（标识任务）。我们通过证明良性输入（例如未修改的图像）是两个任务的足够材料来实现这两个目标。我们利用信息理论方案来进行识别任务。我们为检测任务设计了一种贪婪的歧视算法。两种方法均在空前的1000多个网络中进行实验验证。

translated by 谷歌翻译

Robust Reinforcement Learning with Distributional Risk-averse formulation

Pierre Clavier , Stéphanie Allassonière , Erwan Le Pennec

分类：机器学习 | (统计)机器学习

2022-06-14

强大的加强学习试图使预测对系统的动态或奖励的变化更加强大。当从数据中估算环境的动态和奖励时，此问题尤其重要。在本文中，我们近似使用$ \ phi $ divergence使用近似风险的配方来限制强大的增强学习。我们表明，通过目标的标准偏差惩罚，可以鲁esthing稳健地进行经典的增强学习配方。在经典的健身房环境中提出和测试了两种基于分布强化学习的算法，一种用于离散的算法，一种用于连续的动作空间，以证明算法的鲁棒性。

translated by 谷歌翻译

Action Noise in Off-Policy Deep Reinforcement Learning: Impact on Exploration and Performance

Jakob Hollenstein , Sayantan Auddy , Matteo Saveriano , Erwan Renaudo , Justus Piater

分类：机器学习 | 人工智能

2022-06-08

许多深厚的增强学习算法依赖于简单的探索形式，例如经常在连续控制域中使用的加性动作噪声。通常，该动作噪声的缩放因子被选为高参数，并在训练过程中保持恒定。在本文中，我们分析了学到的政策如何受到噪声类型，比例和缩放系数的影响。我们考虑了两种最突出的动作类型：高斯和ornstein-uhlenbeck噪声，并通过系统地改变噪声类型和规模参数以及测量感兴趣的变量（例如预期的政策回报和策略回报）来执行巨大的实验活动。探索期间的状态空间覆盖范围。对于后者，我们提出了一个新颖的状态空间覆盖量$ \ operatatorName {x} _ {\ Mathcal {u} \ text {rel}} $，对边界人工制品比以前提出的措施更强大。较大的噪声尺度通常会增加状态空间覆盖率。但是，我们发现使用较大的噪声量表增加空间覆盖范围通常是无益的。相反，在训练过程中降低噪声量表可以减少差异并通常改善学习绩效。我们得出的结论是，最好的噪声类型和尺度是环境取决于的，并且根据我们的观察结果，得出了指导选择动作噪声作为进一步优化的起点的启发式规则。

translated by 谷歌翻译

Discovering Useful Compact Sets of Sequential Rules in a Long Sequence

Erwan Bourrand , Luis Galárraga , Esther Galbrun , Elisa Fromont , Alexandre Termier

分类：机器学习 | 人工智能

2021-09-15

We are interested in understanding the underlying generation process for long sequences of symbolic events. To do so, we propose COSSU, an algorithm to mine small and meaningful sets of sequential rules. The rules are selected using an MDL-inspired criterion that favors compactness and relies on a novel rule-based encoding scheme for sequences. Our evaluation shows that COSSU can successfully retrieve relevant sets of closed sequential rules from a long sequence. Such rules constitute an interpretable model that exhibits competitive accuracy for the tasks of next-element prediction and classification.

translated by 谷歌翻译

What's a good imputation to predict with missing values?

Marine Le Morvan , Julie Josse , Erwan Scornet , Gaël Varoquaux

分类： (统计)机器学习 | 人工智能 | 机器学习

2021-06-01

如何在缺少值的数据上学习一个很好的预测仪？大多数努力都专注于首先抵御耐受和第二学习完成数据以预测结果。然而，这种普遍的实践没有理论基础。在这里，我们显示，对于几乎所有估算的功能，具有强大的学习者的赋予归零过程是贝叶斯最佳。此结果适用于所有缺失值机制，与需要缺失随机设置的经典统计结果相比，以在概率模型中使用归属。此外，它意味着良好的预测不需要完美的条件估算。事实上，我们表明，在完美避阻的数据上，最好的回归函数通常是不连续的，这使得很难学习。制作代替估算以便离开回归功能不变只是将问题转移到学习不连续的避难所。相反，我们建议联合学会归纳和回归更容易。我们提出了这种过程，适应Neumiss，一种神经网络，无论缺失值模式如何，捕获观察到的和未观察的变量的条件链接。实验证实，通过Neumiss的联合归因和回归优于我们的实验中的各个步骤程序，其中有限数量的样品。

translated by 谷歌翻译

MDA for random forests: inconsistency, and a practical solution via the Sobol-MDA

Clément Bénard , Sébastien da Veiga , Erwan Scornet

分类： (统计)机器学习 | 机器学习

2021-02-26

可变重要性措施是分析随机林的黑盒机制的主要工具。虽然平均值降低精度（MDA）被广泛接受作为随机森林最有效的可变重要性措施，但对其统计特性知之甚少。实际上，确切的MDA定义在主随机林软件上变化。在本文中，我们的目标是严格分析主要MDA实施的行为。因此，我们在数学上正式地形化各种实施的MDA算法，然后在样本量增加时建立限制。特别是，我们在三个组件中分解了这些限制：第一个与Sobol指数有关，这是对响应方差的协变度贡献的明确定义措施，广泛应用于敏感性分析领域，而不是TheThird术语，谁的价值随着协变量的依赖而增加。因此，我们理论上证明了MDA在协变者依赖时，MDA不会瞄准正确的数量，这是实验发现的事实。为了解决这个问题，我们为随机林，Sobol-MDA定义了一个新的重要性测量，它修复了原始MDA的缺陷。我们证明了Sobol-MDA的一致性，并表明Sobol-MDA在模拟和实际数据上经验胜过其竞争对手。 R和C ++中的开源实现可在线获取。

translated by 谷歌翻译

Trees, forests, and impurity-based variable importance

Erwan Scornet

分类： (统计)机器学习

2020-01-13

树合奏方法如随机森林[Breiman，2001]非常受欢迎，以处理高维表格数据集，特别是因为它们的预测精度良好。然而，当机器学习用于决策问题时，由于开明的决策需要对算法预测过程的深入理解来实现最佳预测程序的解决可能是不合理的。不幸的是，由于他们的预测结果从平均数百个决策树的预测结果，随机森林并不是本质上可解释的。在这种所谓的黑盒算法上获得知识的经典方法是计算可变重要性，这些重点是评估每个输入变量的预测影响。然后使用可变重要性对等变量进行排名或选择变量，从而在数据分析中发挥着重要作用。然而，没有理由使用随机森林变量以这种方式：我们甚至不知道这些数量估计。在本文中，我们分析了两个众所周知的随机森林可变重大之一，平均减少杂质（MDI）。我们证明，如果输入变量是独立的并且在没有相互作用的情况下，MDI提供了输出的方差分解，其中清楚地识别了每个变量的贡献。我们还研究表现出输入变量或交互之间的依赖性的模型，其中变量重要性本质上是不明的。我们的分析表明，与一棵树相比，可能存在使用森林的一些好处。

translated by 谷歌翻译